#tareas complejas

ORAgentBench: Nuevo benchmark para agentes LLM en Investigación Operativa

ORAgentBench: Nuevo benchmark para agentes LLM en Investigación Operativa

ORAgentBench evalúa agentes LLM en investigación operativa. Solo el 35.5% de tareas son superadas; descubre por qué fallan y las lecciones.

2026-06-19 · 2 min

Corriendo el guante: reevaluando las capacidades de agentes IA

Corriendo el guante: reevaluando las capacidades de agentes IA

Descubre GauntletBench: expone las limitaciones de agentes IA - solo 19% éxito vs 80% humano en tareas complejas. ¿Listos para el mundo real?

2026-06-15 · 2 min

Cómo los Agentes de IA Redefinen el Trabajo del Conocimiento: Autonomía, Eficiencia y Alcance

Cómo los Agentes de IA Redefinen el Trabajo del Conocimiento: Autonomía, Eficiencia y Alcance

Los agentes de IA autónomos transforman el trabajo del conocimiento: reducen tiempo y costes un 94%, y mejoran la calidad. Estudio de Perplexity.

2026-06-08 · 2 min